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公交 网 络 路 径 规划 问题 中 的 一 种 高 效 索引 方法 
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摘 要 : TTL 是 在 公交 网 络 中 求解 最 早 到 达 路 径 、 最 晚 出 发 路 径 和 最 短 耗 时 路 径 的 一 种 高 效 索 引 。TTL 采用 Time- 
dependent Dijkstra 为 核心 算法 构建 索引 ， 存 在 两 个 不 足 : 大 量 的 昂贵 的 出 堆 操 作 拖 慢 了 建立 索引 的 效率 以 及 所 求 得 的 
路 径 具 有 较 多 的 换 乘 次 数 。 针 对 这 两 个 不 足 ， 提 出 了 一 种 基于 旅程 的 索引 TAIL, TAIL 预先 生成 部 分 路 径 ， 在 查询 阶 
段 通过 匹配 部 分 路 径 得 到 最 优 解 ， 避 免 在 原 图 上 做 查询 ， 提 高 效率 。TAIL 并 不 是 基于 图 结构 ， 而 是 以 旅程 为 单位 存储 
交 数 据 。 在 生成 路 径 时 ， 首 先 扫描 路 过 起 点 的 旅程 ， 找 到 从 起 点 直达 的 站 点 ; 然后 扫描 从 直达 站 点 出 发 的 旅程 ， 找 
到 一 次 换 乘 可 达 的 站 点 ; 如 是 这 般 ,， 从 可 达 站 点 出 发 扫描 旅程 ,发现 更 多 的 可 达 站 点 。 为 了 在 早期 找到 最 早 到 达 路 径 ， 
从 而 减少 旅程 的 扫描 量 ，TAIL 并 没有 严格 按照 换 乘 次 数 的 顺序 扩展 站 点 。 这 种 方法 避免 了 昂贵 的 堆 操作 ， 也 保留 了 旅 
程 的 完整 性 。 在 真实 数据 集 上 测试 表明 ， 与 TTL 相 比 ，TAIL 有 较 短 的 建立 索引 的 时 间 ， 生 成 的 路 径 的 换 乘 次 数 也 较 
y. 
关键 词 : 最 短路 径 ; 公交 网 络 ; 路 径 规 划 ; 索引 ; 时 间 表 ; 换 乘 次 数 
中 图 分 类 号 : TPT311.13 doi: 10.3969/j.issn.1001-3695.2018.02.0088 


Efficient index for route planning in public transportation networks 
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Abstract: TTL is a highly efficient indexing structure for finding an earliest arrival path, or a latest departure path, or a shortest 
duration path in public transportation networks. TTL uses Time-dependent Dijkstra's algorithm as its core algorithm to build 
index, and is therefore, results in two deficiencies. Firstly, it needs relatively expensive priority queue operations. Secondly, it 
would generate paths with more transfers. This paper proposes a new indexing structure, TAIL, which uses a trip based method 
to build index. TTL pre-computes some canonical paths. A query could be answered by matching up the canonical paths, which 
avoids traversing the entire network. Instead of the graph structure, TAIL uses trip array as its input, and generates paths by 
scanning trips. Initially, TAIL scans trips starting from the source stop, from which TAIL obtains direct reachable stops. After 
that, TAIL scans trips starting from the direct reachable stops, from which TAIL obtains reachable stops within one transfer. 
Generally, TAIL discovers new reachable stops from scanning the trips starting at the already discovered reachable stops. In 
order to obtain the earliest arrival paths in the early stage, so as to reduce the number of trip scanning, TAIL does not scan the 
stops strictly in increasing order of their transfer times. In this way, TAIL avoids valuable priority queue operations, while 
preserves the entity of a trip. Experiments on real datasets shows that, compared to TTL, TAIL has lower index construction 
time and its generated path has fewer transfer times. 
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公交 网 络 中 的 路 径 规划 问题 是 近期 研究 的 一 个 热点 。 给 页 的 路 径 是 哪 条 ? c) 最 短 耗 时 路 径 (shortest duration path, SDP), 
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需要 换 乘 。 如 果 乘 客 携带 行李 ， 换 乘 会 引起 不 便 ， 而 且 会 增加 


延误 的 风险 。 


男 一 方面 ， 


P1 O O 
P2 ©----»>O >O----- >O 
po. do. x 


S 


图 1 从 A 到 C 的 两 条 路 径 
在 路 径 规 划 中 , 换 乘 次 数 是 个 需要 考虑 的 问题 。 
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定义 3 路径 。 设 s 是 起 始 站 点 ，d 是 目标 站 点 。 从 s 到 4d 
的 路 径 定义 为 P=5@f,s,@b, 其 中 5 = ， 
Sim =4d ， 对 于 2<i<k，s 是 旅程 6 和 # 上 的 站 点 。P 表示 在 
站 点 5 上 车 乘坐 旅程 4， 到 站 点 ss 转 乘 旅程 6 ，.….. 到 站 点 S 
转 乘 旅程 如 ， 到 达 站 点 si 。 在 换 乘 站 点 上 满足 时 间 约 束 
即 换 乘 时 前 一 趟 旅程 的 到 达 站 点 的 时 
刻 不 能 晚 于 后 一 趟 旅程 的 出 发 时 刻 。 称 尸 是 长 度 为 大 趟 旅程 的 
路 径 。 己 的 出 发 时 刻 记 为 rw(P) ， 取 值 au 05) 。P 的 到 达 时 
刻 记 为 m0). HUS muss) 。P 的 耗 时 记 为 取 值 
Nr(P) - zt, CP) 。 本 文 研究 的 最 早 到 达 路 径 、 最 晚 到 达 路 径 和 
最 短 耗 时 路 径 定义 如 下 。 
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定义 4 最早 到 达 路 径 (EAP)。 给 定时 间 表 工 、 起 始 站 点 s、 
标 站 点 4、 时 刻 x ，EAP 指 在 所 有 从 s 到 4 的 、 出 发 时 刻 不 
早 于 7 的 路 径 中 ， 具 有 最 早 到 达 时 刻 的 那 条 路 径 。 
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点 以 外 的 所 有 站 点 s， 有 
个 站 点 以 外 的 


标 站 点 4、 时 刻 z'. LDP 指 在 所 有 从 s 到 4 的 、 到 达 时 刻 不 


晚 于 xz' 的 路 径 中 ， 上 有 具有 最 晚 出 发 时 刻 的 那 条 路 径 。 


个 站 点 二 比 石 先 到 达 ( 或 离 
)。 < 关系 也 称 
见 实 的 公交 网 络 中 ,一般 情况 


一 条 线路 下 的 旅程 之 间 满 足 < 关 系 。 但 是 ， 堵 车 等 因素 会 


RIE 


r) 上 的 一 


ons 即 在 前 一 个 站 晚 到 达 (或 出 发 ) 的 旅程 在 后 续 的 站 
点 中 会 早 到 达 ( 或 出 发 )。 在 本 文中 , 若 在 同一 
程 、t,， 不 满足 < 关系 ， 则 将 和 三 
。 于 是 < 关系 是 工 


条 线路 下 存在 旅 
当 作 是 属于 两 条 不 同 的 
个 全 序 。 


Ral 


N 


中 公交 网 络 时 间 表 


ch 


线路 


途径 站 点 与 各 站 点 的 (到 达 ， 出 发 ) 时 刻 


S A 


B 


C D E 


1 0&1 (4,4) 


(8.9) 


(1242) — (15,15) 


2» 04) (7,8) 


(14,15) 


(20,20) (23,23) 


t, (88 (11,11) 


(16,17) 


(21,21) (24,24) 


J 


F 


D G 


4 G8) 


(11,11) 


(14,15) 


r. 


H 


A 


F I 


t; (54) 


(7,8) 


(10,10) (12,8) 


定 
点 的 


T — (testes 


每 个 子 


一 般 性 


l<i<m, 


义 2 


集 合 


ri , 


设 7 下 的 每 个 子 人 
[yx 


I 


n] 


中 iU mio bn2» 
集 与 中 的 元 素 一 一 对 应 ， 即 YreR，T(r)e7 。 不 失 
内 的 旅程 已 按 < 关 系 排序 ， 即 对 于 


时 间 表 。 了 =(5,R,T) 是 一 个 时 间 表 ， 其 中 5 是 站 
Rzín.n. 


是 线路 的 集合 ， 
小 是 旅程 的 划分 。T 下 的 


定义 6 最 短 耗 时 路 径 (SDP)。 给 定时 间 表 了 、 起 始 站 点 s、 
标 站 点 d. Wiz 和 zx'，SDP 指 在 所 有 从 s 到 4 的 、 出 发 时 
刻 不 早 于 7 、 到 达 时 刻 不 晚 于 zm 的 路 径 中 , 具有 最 短 耗 时 的 那 
条 路 径 。 
表 2 给 出 本 文中 常用 的 符号 及 解释 。 
表 2 文中 常用 的 符号 和 解释 。 
符号 含义 
TO) = {ftt} 行驶 线路 x 的 旅程 的 集合 
NR 旅程 + 上 在 站 点 5 的 到 达 时 刻 
和 出 发 时 刻 。 
fi<b 不 超越 f; ， 见 定义 1。 
T -(S,R,T) 时 间 表 ， 见 定义 2。 
P=s Gt,s, Qt, s, Q1, 5, 路 径 P， 见 定义 3。 
Taem(P) 、 A, (P) PP 的 出 发 时 刻 、 到 达 时 刻 
TAIL 索引 中 的 站 点 2 的 标签 集 
L, (u) I L (u) 
合 ， 见 定义 9 
2  TAIL 索引 
2-hub-labeling 是 路 网 (图) 上 求解 最 短路 径 的 一 种 高 效 索 
5|, TTL 引入 2-Hub-Labeling 的 思想 ， 对 含有 时 间 信 息 的 图 建 
立 索 引 。TAIL 也 引入 2-Hub-Labeling 的 思想 , 但 并 不 是 对 图 建 


立 索引 ， 而 是 对 时 间 表 了 = (5,R,7T) 建立 索引 。 与 TTL 相似 ， 
TAIL 对 每 个 站 点 计算 两 个 标签 集合 : Lu RU L(u) ,. Li Qu) 
中 的 每 个 标签 对 应 一 条 从 出 发 到 达 某 个 站 点 的 路 径 ; 对 称 地 ， 
L. (u) 中 的 每 个 标签 对 应 一 条 从 某 个 站 点 出 发 到 达 u 的 路 径 。 

对 于 任意 的 从 起 点 到 目标 4d 的 EAP、LDP 和 SDP 查询 , TAIL 
可 以 从 工 (s) FU L (d) 中 找到 标签 拼接 成 一 条 路 径 得 到 相应 的 


"d 804.02396v1 


XIV: 


china 


录用 稿 


解 。 


TAIL 


这 种 方法 
数据 集 上 从 零 信 


利用 


预先 计算 好 的 路 径 信 


息 查 找 路 径 ， 


避免 在 原 


的 构建 基于 一 个 站 点 
站 点 在 公交 网 络 中 的 
很 重要 ， 因 为 相距 较 远 的 两 个 


位 置 。 


用 ol) 表示 将 站 点 按 重 


但 会 影响 索引 的 大 小 ， 


中 讨论 o 的 计算 。 


TAIL 


息 开始 搜索 ， 大 大 提高 


重要 程度 。 


要 程度 从 高 到 


进而 影 


fi 


5] E 23088 


的 全 序 关 系 , 全 序 关 系 用 来 衡量 
在 公共 交通 网 络 中 ， 交 通 枢纽 


也 方 通常 


企 交 通 枢纽 换 乘 。 


本 文 


氏 排 序 后 ，z 在 序列 中 的 


保留 部 分 基本 路 径 。 


定义 


7 路 径 支配 。 设 
d 的 路 径 。 


元， (P) S Tap D). 


arr 


arr 


Wk Bx P, 


的 索引 并 没有 保存 所 有 从 z BRAFA u 


如 果 


定义 7 的 意思 是 : WDR D Bd AE ZA 
时 刻 不 晚 于 驴 的 ， 则 五 比 


Ey Wi 


c 


XE X 


ZE 


站 点 中 ， 


到 se 的 路 径 P’, 


8 基本 路 径 。 


基本 路 径 ， 如 果 满 足以 下 两 个 条 件 : 
$1 或 Skal 的 等 级 最 高 
P'x i P. 


[| 


假设 


B@1,D 是 一 


条 基本 路 径 ; 


车 ol(u) <oC) ， 表 明 站 点 u 的 重要 程度 排 在 站 点 v 的 前 
面 , BH u 的 等 级 比 y 高 。0 的 选取 并 不 影响 查询 结果 的 正确 性 ， 
向 查询 效率 。 下 文 将 在 第 4.4 di 


的 路 径 , 只 


五 和 已 分 别 是 两 条 从 站 点 2 到 站 点 
Tgn (P) AiP) ， 且 


径 即 可 。 


P-s,QGQt,s,Qr,..., 


P3 


高 ; b) 支 配 约束 


已 更 优 。 若 已 在 一 
HR RARE P, RETK, 也 能 得 到 EAP/LDP/SDP。 所 以 索 
引 只 需 考 虑 不 被 支配 的 路 


于 已 的 ， 且 到 达 
条 EAP/LDP/SDP 


Hol 
Sk G1, Ska 是 一 条 


a) 站 点 等 级 约束 ,P 途径 的 
,不 存在 男 一 条 从 5 


到 2 中 的 站 点 的 重要 程度 依次 为 :DAFSBCEJGHI。 
A@4,D 不 是 基本 路 径 ， 


因为 存在 


路 入 A@t,F@t,D xi AO, D 


定义 
预先 对 


9 TAIL 索引 。 


每 个 站 点 ue5 计算 两 个 标签 集合 
q 个 条 件 : 


a) L Qu) 中 的 每 个 标签 (za 元 


P, 


CREE E 


Xt 


其 本 路 径 


| Zz, 到达。 s, 
b) L (u) 中 


P, 


PN 


| Tar $35 


c)*j ] 


q， 如 果 存 在 解 的 话 ， 


存在 标签 


(S, Tie -— 


(w, Tep T, 


FEEXEIRL MARS A s 到 站 点 4 的 EAP、LDP 或 SDP 查询 
以 下 三 种 情况 之 一 必 成 立 ，(a) 在 工 ,(5) 中 
5) 1 对 应 q 的 解 ，(b) 在 Ld) 中 存在 标签 
Aar) 对 应 q 的 解 ; 或 (0) 在 
, E L (d) 中 存在 标签 (Woo Tarr) 
IIRA P, WE Tar STan, MEI PAIP} 


(d, T iep T, 


o? 对 应 路 径 已 


有 olv)<o(lu)。 其 中 PP 在 时 
,是 P 上 继 4 之 后 的 第 一 个 
的 每 个 标签 (v, 7T lept ? 
^Ho(v)«o(u), B 
Srei FE P EFIS u 的 


给 定时 间 表 了 = ($， 


54) XS 


ju 

asy) NIR 
中 PP 在 时 
前 一 个 换 乘 


L, 


R,T), TAIL 索引 


Lu) 8 L (u), WE 


M— ZAM u S] v BS 


刻 Tam 出 发 ， 在 时 


乘 站 点 。 


应 一 条 从 v 到 zx 的 


刻 T dept 出 发 ， 在 时 


站 点 。 


(5) 中 存在 标签 


接 成 的 路 径 构 成 


1 对 标 


签 中 暂 不 关注 


的 分 量 的 值 


点 表示 ， 下 同 


q 的 解 。 


d) L. Qu) 中 的 标签 按 
发 时 刻 为 第 二 关键 字 升 序 


' ' 
= (V'A uep T 


签 也 按 同 样 


对 于 定义 9 的 第 d), 


! 
o(v) - (v^) H T dept < T dept , I zs 


， 等 : 公交 网 络 路 和 Ghi nave 


vi 


A 


期 刊 I] 


标 顶 点 的 等 级 序 o 为 第 一 关键 字 
HET. HEUS, WT 《VY, Tap T 
a) ABRE LL GO 中 的 标签 
o(v) «o(v) , oV) 2 o(v) F Zap < Tap o 
的 规则 排序 。 


pon) 


在 Lu) 中 的 标签 ! rn, 
本 路 径 的 支配 性 可 得 ， 必 有 


法 


Lu 
Lu 


和 


，1 排 在 /之 前 ， 如 果 
对 工 (w) 中 的 规则 标 


若 


发 


Ny < NA o MEW, LW 中 具有 相同 目标 点 的 标签 ， 按 出 
时 刻 和 到 达 时 刻 的 升序 排列 。 对 元 (oO 同 理 。 
d 3 列 出 了 对 应 表 1 的 例子 中 的 标签 集合 上 (S$) fI L CE) 
的 内 容 。 
表 3 PER L, (S) fü L (E) 
集合 标签 
1(D,4,4, A) 1,(D,8,24, A) 
L (S) 
L(A,1,4,S) LCLA],S) 1,(4,8,11,5) 
L(E)  &D,15,19,E) L(D,23,27,E) 1(D,24,28, E) 
3 ”查询 算法 


定义 9 的 第 点 给 出 了 查询 的 思路 。 对 于 从 站 点 5 到 站 点 


d 的 、 


l, — (u, Tip T. 


DM 


路 径 是 4 的 候选 解 。 
q 的 解 。 这 个 求解 过 


询 
询 ， 


出 发 时 刻 不 早 于 、 
算法 在 TAIL 索引 的 LG) 


Ba 


HL z'—o; XF LDP 查询 ， 


到 达 时 刻 不 晚 了 


Fa 的 SDP 查询 q, 
Pp 找到 出 发 时 刻 >z 的 标签 


ME Ld) 中 找到 到 达 时 刻 <x 的 标签 
2o? , WR uu H Zi S Tiow，, 则 1 和 拼接 的 


算法 找 出 所 有 人 


程 类 似 数 


标签 已 排 好 序 ， 所 以 可 
找 出 所 有 候选 解 。 例 如 查询 从 5 到 


" 
H 


以 通过 线性 


库 的 


区 z=0。 由 于 标签 集合 


Hd L)$I Ld) HE 


内 


ER 


H HAST ZA S 


到 达 时 刻 不 晚 于 30 的 SDP， 对 应 表 3, 


DREL, ELE) pH 
得 到 候选 解 ， 用 4+4k6 表示 。 
(le,0,4s ) 是 按 到 达 时 刻 升序 排 
能 生成 更 优 的 解 
标签 2 ， 同 时 也 扫 

能 构成 路 径 , 所 以 只 能 再 扫描 工 (E) 
L+ RKR. Zk LE) 的 标签 扫描 
EL+LML+ HAF, 
算法 详情 请 参 


因为 它们 不 可 


一 条 候选 路 径 
询 结束 。 
的 解 。 


来 


El 


a 


上 述 算法 只 
H Ld) Bs aging UL" , 
的 完整 路 径 。 


, 用 


能 得 到 解 的 标签 


大 | 


列 的 ， 


jii L (E) 


参考 文 [1]。 


描 第 一 个 标签 ， 
dT LG) 


因此 没 必 


FE 


4 和 4 能 


大 | 


再 从 中 选 出 符合 查 
I 连接 操作 。 对 于 EAP fi 


的 


p 
[m] 


ET 3. 

首先 在 LC) 扫描 第 一 
构成 路 径 ， 

PEAN D 的 标签 
要 再 配对 1 RI Lis 
解 。 接 下 来 , di LOS) 中 的 下 一 
中 的 下 一 个 标签 。 因 为 上 和 六 不 
下 一 个 标签 ,得 到 又 


iis 
完毕 ， 查 


h+k 的 耗 时 最 短 ， 为 查询 9 


需要 用 标签 


, HRA LG) 的 标签 记 为 1 ， 


重 构 回 包含 换 乘 详细 信 


为 TAIL 与 TTL 生成 基本 路 径 的 方法 不 同 ， 
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录用 稿 


所 以 对 路 径 标 记 的 方法 也 不 同 。 设 LU 表示 的 路 径 的 目标 点 ( 即 
1” 表示 的 路 径 的 起 始点 ) 是 v， 则 查询 4 生成 的 路 径路 过 的 等 
级 最 高 的 站 点 是 v。 以 1 为 例 解释 重 构 路 径 的 过 程 。 假 设 1 
NINE P-sQnwGn,.v, DL" 记录 下 站 点 第 一 个 换 乘 wo 
fp n d 3 中 的 标签 141I44》 表示 的 路 径 是 
SQrn,AQr,FOrn,D, 所 以 4 记录 下 站 点 A. n uEB] L, w) 包 
ERRE lano la 对 应 一 条 从 w 到 v 的、 出 发 时 刻 不 早 于 
Tu, Ww) 、 到 达 时 刻 不 晚 于 Tar CP) 的 基本 路 径 。 这 是 因为 : 


p 


a) P 是 上 (5) 中 的 标签 对 应 的 基本 路 径 ， 所 以 了 路 过 的 站 
点 中 , v 的 等 级 最 高 ， 路 径 卫 的 后 级 Pu, =w@t,…,v 满 足 站 点 
的 等 级 约束 。 


b) P, 是 一 条 出 发 时 刻 不 早 于 mu. Ww) 、 到 达 时 刻 等 于 
Tar (P) 的 路 径 。 若 不 存在 路 径 PP 支配 PB, ， 结 合 (1)， 则 PB 在 
及 OO 内 。 和 否则 ， 设 存在 路 径 已 文 配 Row ， 证 明 1 对 应 P'。 分 
两 种 情况 讨论 : (a) 如 果 P 的 站 点 满足 等 级 约束 ， 则 P' 是 基本 路 
径 ， 所 以 4 对 应 P'(b) 如 果 P 的 站 点 不 满足 等 级 约束 ， 即 已 
上 路 过 某 个 站 点 的 等 级 比 v ms 男 一 方面 ， 在 P 中 用 PTS 
Row， 与 三 能 拼接 上 路 径 ， 构 成 的 路 径 也 是 查询 q 的 解 ， 这 与 
“查询 q 生成 的 路 径路 过 的 等 级 最 高 的 站 点 是 v" Je o 


Dub, CUN LU 的 第 一 个 换 乘 点 是 ww， 必定 能 在 LO) 下 找 
标签 重 构 w@t,…,v 这 段子 路 ， 这 只 需要 在 Lw) 下 调用 
次 二 分 查找 即 可 。 对 的 重 构 同 理 。 假 设 查询 结果 是 长 度 为 天 
趟 旅程 的 路 径 ， 则 /YY RU UU 最 多 需要 次 二 分 查找 即 可 重 构 完 


4 ”构建 索引 


4.1 基于 旅程 扫描 的 查询 算法 

RAPTORU!ff] 4 Tf 7& Round-bAsed Public Transit Optimized 
Router, 顾名思义 , 算法 的 思想 是 “一 轮 接 一 轮 ” 地 查找 最 早 到 达 
路 径 ， 所 谓 “ 轮 ? 指 一 次 从 上 车 到 下 车 的 乘坐 过 程 。 第 一 轮 ， 算 
法 扫描 途径 起 始 站 点 的 每 一 条 线路 ， 发 现 从 起 始 站 点 直达 的 站 
点 ， 更 新 它们 的 最 早 到 达 时 刻 ， 把 它们 的 集合 记 为 Q 。 换 句 话 
说 ， 当 前 找到 的 到 达 Q 中 的 站 点 的 路 径 ， 都 是 长 度 为 1 趟 旅程 
的 路 径 。 接 下 来 , RAPTOR 如 是 重复 以 下 步骤 : 令 O. 表示 经 过 
大 轮 乘坐 后 到 达 的 、 且 到 达 时 刻 比 经 过 z < k) 轮 乘 坐 的 更 早 的 
站 点 的 集合 ， 即 到 达 Q 中 的 站 点 2 的 路 径 ， 是 长 度 为 下 趟 旅程 
的 路 径 ， 而 且 比 长 度 为 i< K) 趟 旅程 的 路 径 都 早 到 达 。 扫 描 途 
ff u 中 的 站 点 的 线路 ， 有 可 能 发 现 上 +1 轮 到 达 的 、 到 达 时 刻 更 
旱 的 站 点 ， 生 成 集合 Quio KIW, RAPTOR 从 k=1 开 始 ， 
先 求 出 长 度 为 上 趟 旅程 的 最 早 到 达 路 径 ， 再 求 出 长 度 为 E+1 趟 
旅程 的 最 早 到 达 路 径 。 这 个 过 程 有 点 类 似 图 的 广度 优先 遍历 。 


pu 


假设 到 达 站 点 v 的 最 早 到 达 路 径 需 要 经 过 站 点 u MWA, 
TE u HJ EAP 计算 出 来 之 前 , 用 站 点 4 去 扩展 路 径 的 工作 是 徒劳 
的 。 壁 如 在 图 2 H, MAR S EA E 的 出 发 时 刻 不 早 于 3 的 路 


马 om, 等 


ft sQeLn,AQr,FOGr,DOn,ESISQGDL,E,T pmi EAP. 


有 从 五 出 发 的 路 径 的 话 ) 


到 达 互 的 路 径 需 要 途径 D, 而 DD 的 最 早 到 达 时 刻 会 影响 的 最 
早 到 达 时 刻 ， 进 而 会 影响 从 五 出 发 的 路 径 〈 如 果 公 交 网 络 中 还 
。RAPTOR 需要 等 到 第 3 轮 才能 找到 
ZJ D KJ EAP SOGrn,AGnFQGrnD ， 即 是 说 , 在 第 2、3 轮 


扩展 站 点 DD 及 DD 出 发 的 路 径 都 是 徒劳 。 因此 ， 本文 的 算法 去 掉 


扩展 路 径 时 的 轮 数 限制 ， 


仅 用 集合 2 记录 到 达 时 刻 得 到 更 新 的 


站 点 的 集合 ， 初 始 时 和 仅 包 含 起 始 站 点 。 取 2 中 的 站 点 xz 出 来 
扩展 路 径 , 若 发 现 新 扩展 的 路 径 能 


早 地 到 达 站 点 v, 则 将 v 加 


i 


EO , nya 


复 直 到 Q 为 空 。 这 样 能 部 分 减少 无 谓 的 路 径 扩 展 。 


算法 1 描述 了 查找 从 s 到 4 的 、 出 发 时 刻 不 早 于 7 的 EAP 


的 过 程 。 算 法 | 


] ru) 记录 当前 找到 的 到 达 站 点 wu 的 最 早 时 刻 。 


初始 时 ，s 的 最 早 到 达 时 刻 设 为 x ， 其 它 站 点 的 最 早 到 达 时 刻 


设 为 wo( 第 1 行 )。 算 法 | 


符号 各 ,记录 线路 x 上 的 站 点 u 被 扫 


描 过 的 最 早 的 旅程 是 哪 


M u 出 发 的 旅程 时 ， 只 需要 扫描 < 么 ,的 旅程 即 可 : 因为 勾 .的 


条 。 在 后 续 计算 过 程 中 ， 当 扫描 > 上 


变 小 。 算 法 通过 记录 Aru 


取 值 意味 着 算法 已 经 用 旅程 ra 检查 > 上 在 wu 之 后 的 站 点 v, 使 
得 的 v 最 早 到 达 时 刻 不 会 晚 于 Tarla V) 。 因此， 当 
的 站 点 4 开始 扫描 旅程 时 ,只 有 的 <4,, 旅程 才 有 可 能 使 得 7(v) 


PARA r 上 


限制 旅程 被 重复 扫描 。 初 始 时 人 设 


DUM 
f). 


A1. FindEAP(T ,s,z) 


它 表 示 旅 程 的 最 大 元 ， 


即 对 所 有 旅程 1, Ath (第 2 


输入 : 起 始 站 点 s， 时 刻 。 
输出 : 在 不 早 于 7 时刻 从 s 出 发 到 达 其 余 站 点 的 EAP 的 到 达 时 


令 T(5)=%。 


HTAA r, Bur EWW. Auh. 


Zl. 

L. 4c(s)2z ,对 于 s eS-ls), 
2. 

3. 4 o(s)- nil 。 

4 ” 令 集 合 Q = {5} 。 

5: while Q 非 空 

6. 从 取出 一 个 站 点 us 

7. foreach 途径 4 的 线路 > 

8. 


WR p 不 存在 ， 转 7。 


设 p Kl P < Åu H Tap (PU) Z TU) 的 最 早 的 旅程 。 


9. 扫描 pg， 从 点 开始 依次 访问 后 继 站 点 v 
10. if ART p, FERH p, $87. 
11. if zQ(pv)«c(v) 

12. 4T()-zm,(pv), o()-u 
13. 令 儿 ,= 了。 

14. 将 v 加 进 Q。 


15. ”返回 所 有 站 点 的 最 早 到 达 时 刻 T(*) 。 
TEH ou) 记录 在 到 达 w 之 前 的 换 乘 站 点 ， 初 始 时 o(s) 
设 为 空 (第 3 行 )。 接 下 来 ， 算 法 反复 从 集合 8 取出 站 点 扩展 路 


径 。 在 扩展 站 点 转 乘 的 路 径 时 ， 
7 行 )， 如 果 存 在 比 之 前 扫描 过 的 更 早 的 旅程 P， 满 足 忆 上 zx 的 
出 发 时 刻 不 早 于 uc 的 到 达 时 刻 (第 8 行 )， 则 沿线 更 新 x 之 后 的 
站 点 v 的 到 达 时 刻 ( 第 9~14 行 )。 如 果 发 现 乘 坐 旅程 p SI v 的 
时 刻 比 之 前 找到 的 更 优 (第 11 fr), MEX TO) = zu), 


对 于 每 一 条 路 过 u 的 线路 (第 
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ids v 是 通 


当 再 没有 站 点 的 最 早 到 达 时 刻 有 更 新 时 ， 


的 最 早 到 达 时 刻 cC) 


(第 15 行 )。 


假设 在 图 2 的 例子 中 ， 
刻 不 早 于 3 的 EAP, X A 列 出 了 求解 过 程 。 
HIRIE t, MAEA u 开始 沿线 更 新 u 之 后 的 站 点 的 最 早 到 达 时 


查找 从 站 点 5S 到 站 点 的 、 出 发 时 


过 在 u 点 换 乘 到 达 的 (第 12 行 )， 记 录 下 线路 > 上 站 
和 过 的 最 早 旅程 是 p( 第 13 行 )， 将 er 14 行 )。 


算法 结束 ， 返 回 站 点 


第 一 列 wu@t 表示 扫 


刻 。 第 二 列表 示 扫 描 上 后 生成 的 集合 2 ， 第 三 列 列 出 扫描 上 后 
更 新 了 的 站 点 的 最 早 到 达 时 刻 。 表 4 仅 列 出 算法 扫描 过 的 的 旅 
程 。 例 如 在 第 2 行 处 理 完 4 站 点 之 后 ， 该 从 Q 取出 BB。 因为 路 
过 B 的 线路 ,满足 出 发 时 刻 > 14(B 的 到 达 时 刻 ) 的 旅程 还 是 
,而 之 前 在 扫描 S@6 的 时 候 已 经 记录 下 Asus =， 所 以 三 不 
会 重复 被 扫描 。 
表 4 在 图 2 中 查找 从 S 到 EE、 出 发 时 刻 不 早 于 3 的 EAP 的 过 程 
ut Q 更 新 的 各 站 点 的 最 早 到 达 时 刻 

S Gt, {4,B,C,D,E} A:7,B:14,C:20,D:23,E:27 

A@t,  (BCDEEn F:10,1:12 

F@t {LD,G} D:14, G:17 

D@t, {GE} E:19 


对 称 地 ， 可 得 到 算法 FindLDP(T ,d,z) 查询 从 其 余 站 点 出 


发 、 在 z 时 刻 到 达 站 点 a 的 最 晚 出 发 路 径 。FindLDP 从 目标 站 


点 d 开始 反 向 扩展 路 径 , 求 得 每 个 站 点 u 要 在 m 时刻 到 达 4 的 


dá, 最 晚 出 发 时 刻 ru) o 


具体 地 ， 初始 时 集合 


={d} ,每 次 从 


0 取出 一 个 站 点 wu, 扩展 每 条 途径 w 的 线路 7; 找到 x 下 的 满足 


Tar (pu) STU) fce B EE p, M u 开始 


前 驱 站 点 v， 更 新 7(v) 。 
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度 上 保持 了 旅程 的 完整 性 。 在 算法 1 中 ， 


被 发 E, 


由 于 算法 1 通过 扫 


不 能 改进 目 


Æ, 假设 
或 之 后 从 4 


AQtn,FQGnL,DGODn E, Sikh A27. TAIL 第 
A 的 旅程 有 和 ,在 扫描 
以 及 r(E)=27 。 
AQrt.,FQt.,D.c(D) 


数 少 的 路 径 )， 


D 点 被 扫描 过 ; 


标点 的 最 早 到 达 时 刻 ， 
进而 减少 了 路 径 的 换 乘 次 数 。 
t, 到 达 和 离开 DD 的 时 刻 改 成 16 和 16， 求 解 在 8 时 刻 
TTL 找到 的 路 径 是 


出 发 的 EAP. 


E 


， 通 过 


男 一 方面 


I p RHH 


H 的 


省 旅程 的 方式 生成 路 径 ， 所 以 在 一 定 程 


换 乘 次 数 少 的 路 径 先 


换 乘 次 数 多 的 路 径 后 被 发 现 ， 如 果 换 乘 次 数 多 的 路 径 
则 仍 保留 换 乘 次 数 少 的 路 径 ， 
以 图 2 和 表 


1 的 公交 网 络 为 例 解 


步 扫 描 路 过 


£j X, Wi: 公交 网 络 路 和 Gh 


论 如 何不 遗漏 地 、 高 效 地 找 出 所 有 基本 路 径 。 
Sao BID ER SS. Sets 


级 从 高 到 低 排序 依次 为 $2 
等 级 比 BS Satt s, 的 等 级 比 
中 5; 的 出 发 时 刻 的 集合 。 
发 的 EAP 可 分 成 两 类 : 

站 点 , 它们 


可 能 是 基本 路 径 ; 第 二 类 路 径 途 


点 ， 它 们 违反 了 站 点 的 等 级 约束 ， 不 是 基本 路 径 。 
VETE P, W PLE P EMEA s Sis(sels. 


点 的 那 截 路 ， 则 Po. 可 能 是 基本 路 径 。 


FindEAP(T ,si, 1) RA s, RO EAP 的 时 候 ， 如 果 在 扫描 旅程 
S 的 站 点 s， 则 不 需要 
Hi s 之 后 的 站 点 v， 因 为 到 达 v 的 路 径 需 

能 是 基本 路 径 。 算法 2 描述 了 建立 索引 的 过 程 ， 


时 ( FindEAP 的 第 9 IER sels, 
再 扫 


了 求 从 s; 出 发 的 基本 路 径 的 


AXE. BuildIndex(T ,o) 
输入 : 时 间 表 了 =(9,R,7) 和 站 点 序 o 
输出 : TAIL 索引 。 


体 过 程 。 


1. WFE A u, L Q0) 和 元 (0 都 初始 化 为 名 。 

pa fon i-L2,-.,n 

3. Ws; 是 序 为 i 的 站 点 ， 即 0(5;) Si. 

4. 设 本 表示 所 有 从 s; 出 发 的 时 刻 的 集合 ， 即 IIo mu Qs) | s; 

是 旅程 1 途径 的 站 点 }。 

5. 4t(s)-2z x TseS—is), 令 T(s)=% 

6. IFAH r uder EI. 4 Au 

T: 按时 刻 从 晚 到 早 的 顺序 访问 每 个 x e 

8. 调用 FindEAP(T s; z) , 作 以 下 两 个 改动 : (1) 从 第 3 行 
始 调用 ，(2) 第 10 行 增加 停止 条 件 ， 如 果 AET p, 或 0(v) < 0(s,)， 

停止 扫描 p 

9. foreach 站 点 s: o(s) > o(s;) 

10. 4 1 -(s,z,T(s).o(s)) 

11. 站 1 均 满 足以 下 两 个 条 件 : (1) EL) 中 不 存在 标签 

l= hS, Aa) ， 使 A STCS) Q 不 存在 


L = (V, Tipi Tur mm D ELLs) ， 
Tier S Tip ， 
12. 重复 第 4~11 dy. WETI 是 所 有 到 
II- (7, (t.s;) | s; 是 旅程 1 途径 的 站 点 }。 
到 早 的 顺序 调用 FindLDP(T ,s;, 7)， 
集合 。 
13. ”返回 所 有 站 点 的 标 检 集合 。 

ERA 5; 出 发 的 基本 路 径 的 时 候 ， 
在 本 中 任意 时 刻 z 从 5 


I OZ SRI AOL E (RK 
在 随后 的 扫描 ， 得 到 路 径 
16 。 再 次 扫描 路 过 DD 的 旅程 时 
更 多 次 换 乘 、 到 达 时 


已 在 
刻 也 比 


EZ 


7,(5,D) 早 的 路 径 AQ, F Q1, D 沿线 能 走 的 最 早 的 旅程 


仍然 是 ， 即 不 能 
A@t, 上 仍然 保留 ， 不 会 


43 生成 标签 


被 替换 。 


集合 
TAIL 索引 需 


dE E 的 到 达 时 刻 ， 


所 以 到 达 E 的 路 径 


要 计算 时 间 表 工 中 的 所 有 基本 路 径 ， 本 节 讨 


但 这 样 作 会 产生 很 大 的 计算 量 。 


8 的 低 。 设 工 表示 时 间 表 太 
对 于 所 有 的 xe， 在 zt 时刻 从 5; 出 
第 一 类 路 径 不 途径 集合 isses 


对 工 中 的 所 有 时 刻 元 ， 
与 第 8 行 做 类 似 的 改动 ， 生 成 标签 


VERBI 
nX ivg ar 引 方法 


i S 中 站 点 的 等 
5 的 


5,4) 中 的 
RÍE issu 中 的 站 
对 于 第 二 类 
5, 1) ) 的 前 一 个 站 
换 句 话说 ， 在 调用 


要 路 过 s， 它 不 可 
第 4~11 行 描述 


Lut) e LG) 
BUG Tarl] [XT(5)] 在 ， 则 将 1 添加 进 工 (s) 中 。 


达 5; 的 时 刻 的 集合 ， 即 
TAM 


一 种 直观 的 做 法 是 求 出 
出 发 的 EAP, 再 把 被 支配 的 EAP 去 掉 ， 
留意 到 在 x 时 刻 出 发 的 路 径 仅 


可 能 被 z' (zx) 时 刻 出 发 的 路 径 支 配 ， 


的 时 刻 从 晚 到 早 的 顺序 生成 EAP， 新 生成 的 EAP 仅 可 能 被 已 
生成 的 EAP 支配 ， 于 是 通过 检查 已 生成 


因此 ， 可 以 按照 廿 中 


的 EAP 判断 新 生成 的 


EAP 是 否 是 基本 路 径 ， 决 定 是 否 


在 调用 完 


设 Tw 是 本 中 的 最 大 元 。 


Ji, TG) 即 为 在 zwar 时 刻 从 5; 到 s 的 最 早 到 达 时 刻 ， 


将 它 加 进 标签 集合 。 


FindEAP(T,s,,N,) 之 
,表示 


途径 线路 r+ 上 的 站 点 & 的 最 早 的 旅程 是 哪 条 。 在 下 一 越 求 在 zx 


(T< Tna TAE RKI EAP 的 时 候 , 可 以 延 


J T(S) ft A, 的 值 。 
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这 是 因为 : BRAIRE P E Ana ZIA 5; 出 发 、 在 5(s) 时 刻 到 
达 s， 那 么 ， 若 在 zz 时 刻 从 s; 出发、 到达 s 的 路 径 P' 的 到 达 时 
刻 >z(s) ， 则 了 被 P 支配， 于 是 没 必 要 再 扩展 P'， 因 为 扩展 P 
不 会 得 到 比 扩展 P 更 优 的 路 径 。 ^a 的 初始 化 同 理 。 因 此 ， 
算法 2 仅 在 第 5、6 行 对 rt(s) 和 4.… 做 初始 化 ， 随 后 ,按照 时 刻 
从 晚 到 早 的 顺序 调用 FIndEAPQT. s.m) (第 7、8 行 )。 调 用 完 
FindEAP(T,s.z) 后 ， 检 查 每 个 等 级 比 5; 低 的 站 点 s( 第 9 行 )， 
生成 在 z 时 刻 从 5; 出 发 .在 tT(s) 时 刻 到 达 s 的 标签 1( 第 10 行 )。 
如 果 /1 不 被 上 (5) 中 的 标签 对 应 的 路 径 支 配 ( 第 11 行 的 条 件 1)， 
也 不 被 从 s; 8] s 路 过 更 高 等 级 的 点 的 路 径 支 配 (第 11 行 的 条 件 
2), Wife mt LG) rp. 


98 4-11 行 逆向 的 方式 , 调用 FindLDP, 
于 篇 幅 关 系 不 再 歼 


算法 第 12 行 采 用 与 
找 出 到 达 5; 的 LDP， 从 中 求 出 基本 路 径 ， 
述 。 


4.4 站 点 等 级 序 o 的 计算 

尽管 站 点 的 等 级 序 o 的 选取 不 影响 查询 结果 的 正确 性 ， 但 
会 影响 索引 所 包含 的 标签 数目 ， 进 而 影响 查询 效率 。 要 精确 计 
算出 o, 使 得 索引 所 包含 的 的 标签 数 最 少 是 一 个 NP- 难 的 问题 。 
本 文 沿用 文 [1] 的 方法 ， 对 o 进行 启发 式 计算 。 如 果 一 个 站 点 z 
在 一 条 EAPP Ek u 覆盖 Ps MA u 出 发 的 标签 和 到 达 u 的 标签 
可 以 生成 部 分 路 过 点 2 的 EAP。 所 以 ， 直 观 地 ，v 覆盖 的 EAP 
BRA, u 的 等 级 就 应 该 越 高 ， 这 样 u 出 发 的 和 到 达 uc 的 标签 就 
可 以 生成 越 多 的 EAP, 由 于 EAP 太 多 逐一 枚 举 耗 费 太 大 , 所 以 
采用 这 样 的 方法 计算 站 点 等 级 序 o: 随 机 生成 一 个 站 点 集合 
S. CS ， 对 5, 中 的 每 个 站 点 wu， 随机 生成 一 个 时 刻 ,调用 
FindEAP(T,u,7) Rh u 到 其 余 站 点 的 EAP， 这 些 EAP 构成 一 
棵 以 为 根 的 树 , 这 样 一 共有 15 | 棵 树 。 对 于 每 棵 树 ， 留 意 到 
树 上 的 顶点 v 到 v 的 子孙 的 路 径 也 是 EAP， 因 此 v 覆盖 的 EAP 
数目 等 于 以 v 为 根 的 子 树 所 包含 的 顶点 数 ， 包 括 v 自身 。 如 是 
统计 各 个 站 点 u 在 | S. | 棵 树 覆 盖 的 EAP 总 数 。 算 法 首先 选 
覆盖 EAP 数 最 多 的 点 5 作为 等 级 最 高 的 站 点 ; 然后 在 每 棵 树 
I 除 以 % 为 根 的 子 树 ， 再 更 新 各 个 站 点 覆盖 的 EAP Zo, XE TERI 
下 的 子 树 中 履 盖 EAP 数目 最 大 的 站 点 ss 作为 等 级 次 高 的 站 点 ， 
依次 类 推 。 若 15; | 棵 树 被 删除 完 后 ， 仍 有 站 点 的 等 级 未 定 ， 
站 点 所 在 的 旅程 总 数 多 的 等 级 排 在 前 列 。 


bel 


L 上 上 


5 ”实验 


实验 采用 C++ 语言 编写 测试 代码 , 测试 平台 是 Centos 7.0, 
机 器 配置 CPU Intel® Xeon? CPU E5-2640 v4， 内 存 64 GB。 实 
验 数 据 来 自 GTFSD。GTFS 提供 了 某 些 地 区 的 真实 的 公交 数据 ， 
数据 格式 与 本 文 讨论 的 时 间 表 工 的 格式 一 致 。GTFS 中 对 时 间 
采用 "时 :分 : 秒 "的 格式 表示 , 在 实验 中 转换 成 以 秒 为 单位 的 整数 
表示 ， 例 如 :"9:10:06" 用 整数 33006 表示 。 因 为 部 分 GTFS 数据 
中 ， 同 一 条 线路 下 的 旅程 不 满足 < 关系 ， 所 以 把 这 些 旅程 拆 分 
成 不 同 线路 处 理 。TTL 算法 基于 图 结构 ,用 GTFS 数据 生成 图 。 


4 


马 ox, 


数据 集 的 大 小 如 表 5 所 示 , 对 于 


T TTL 的 顶点 数 。 


F: 公交 网 络 路 径 规划 问 


a à 
C hinaXive (ERR. 


的 一 种 高 效 索 引 方法 


每 个 数据 集 ，TAIL 的 站 点 数 等 


表 5 数据 集 大 小 
TAIL TTL 

线路 数 旅程 数 顶点 数 边 数 

Austin 0.36K 11.7K 2.6K 363K 
Budapest 18K 114.7K 72K 1971 K 
Houston 0.5K 174K 89K 1077 K 
Denver 13K 30.7K 9.3 K 1160 K 

Saint 
22K 261.6 K 73K 2863 K 
Petersburg 

Rome 15K 100.8 K 9.1 开 3004K 
Toronto 17K 91.3 K 10.3 K 3755 K 
Berlin 15.7K 169.3 K 39.9K 3377K 


实验 从 建立 索引 的 时 间 、 


H 


E 成 索引 的 大 小 、 查 询 时 间 和 生 


成 路 径 的 换 乘 次 数 比较 TAIL 41 TTL 索引 。 因 为 TAIL 和 TTL 


索引 的 思想 相似 , 区 别 在 了 
和 TTL 索引 大 小 、 查 询 时 
索引 大 小 和 查询 时 间 的 数 提 


径 的 长 度 对 比 TAIL 和 TTL。 


5.1 建立 索引 的 时 间 


TAIL 和 TTL 索引 的 如 


ji 9 
o 


TTL 生成 索引 的 时 间 如 图 


实验 首先 对 每 个 数据 集 4 
生成 索引 。 索 引 生成 两 遍 


E Jo, 


F 生成 索引 的 算法 不 一 样 , 所 以 TAIL 
间 相 仿 ， 由 于 篇 


罗列 


EKRAL 


虽 。 下 面 从 建立 索引 的 时 间 和 生成 路 


EE 并 都 需要 基于 顶点 /站 点 的 等 级 序 


等 级 序 o， 然 后 对 TAIL 和 TTL 


， 时 间 取 两 次 实验 的 平均 值 。TAIL 和 


3 所 示 ， 纵 轴 显 示 以 s 为 单位 。 


TAL EE TTL [ 


索引 时 间 (s) 
a 


: ES B 


Austin Budapest Houston Denver 
(a) ”前 四 组 数据 
TAL EE TTL SY 
3000 T T T T 
2500 
2000 
m 
至 1500 
500 N 
: mÓ | NN 
SaintPetersburg Rome Toronto Berlin 
(b) ”后 四 组 数据 
图 3 建立 索引 的 时 间 


从 图 


3 可 得 ，TAIL 建立 索引 的 时 间 总 体 比 TTL 的 小 ， 原 


:201804.02396v1 


IV 


chinaX 


录用 稿 


因 在 于 两 点 : a) TAIL 反复 用 0(1) 的 时 间 从 集合 取 一 个 站 点 出 
来 扩展 路 径 ， 而 TTL 需要 反复 从 最 小 堆 用 O(log n) 的 时 间 取 一 
个 站 点 ; b) 在 按 出 发 时 刻 从 最 晚 到 最 早 的 顺序 求 从 站 点 s; 出 发 
的 基本 路 径 的 时 候 ， TAIL 利用 了 在 7 时刻 计 算 的 4 的 值 避 
免 重新 搜索 旅程 。 


比 外 ，TAIL 建立 索引 所 花 的 时 间 与 平均 一 条 线路 包含 旅 
程 数 和 平均 一 条 线路 上 的 站 点 数 ( 即 站 点 数 /线路 数 ) 相 关 。 以 求 
从 5; 出 发 的 EAP 为 例 解 释 其 原因 。 首 先 ， FindEAP(T,s,7z) 第 
8 行 在 同一 条 线路 下 查找 满足 时 间 约 束 的 最 早 的 旅程 来 更 新 站 
点 的 最 早 到 达 时 刻 。 如 果 一 条 线路 包含 的 旅程 数 越 多 ， 此 步 又 
所 排除 的 旅程 数 (排除 那些 不 能 生成 EAP 的 旅程 ) 也 越 多 ， 因 此 
建立 索引 的 时 间 越 短 ， 例 如 数据 集 Budapest 和 Rome。 其 次 ， 
平均 一 条 线路 的 站 点 数 越 多 ，TAIL 和 TTL 建立 索引 的 时 间 差 
就 越 明 显 ; 而 平均 一 条 线路 上 的 站 点 数 越 少 ，TAIL 和 TTL 建 
立 索 引 的 时 间 差 别 越 少 ， 甚 至 TAL 花 的 时 间 略 超过 TTL 的 。 
像 Berlin 这 组 数据 的 线路 数 很 多 (线路 数 多 是 因为 同一 线路 下 
存在 多 条 旅程 不 满足 < 关系 ， 被 拆 分 成 多 条 线路 处 理 )， 平 均 扫 
次 旅程 所 更 新 的 站 点 数 也 不 足 3 个 (39.9K/15.7K) ; 同时 
TAIL 需要 扫描 路 过 各 站 点 的 各 条 线路 ,， Berlin 的 站 点 数 和 线路 
数 都 很 大 ， 所 以 计算 量 较 大 。 相 比 之 下 ，TTL 虽然 用 O(log n) 
的 复杂 度 取 站 点 出 来 扩展 ， 但 能 保证 取出 来 的 站 点 的 最 早 到 达 
时 刻 是 正确 的 ， 省 去 了 反复 扫描 线路 的 计算 。 


5.2 HERZ 

对 每 组 数据 ， 实 验 随机 生成 100,000 个 查询 。 每 个 查询 包 
含 起 始 站 点 、 目 标 站 点 和 出 发 时 刻 。 实 验 分 别 对 TAIL 和 TTL 
执行 这 100,000 个 查询 求 EAP， 然 后 重 构 每 条 路 径 ， 得 到 路 径 
的 换 乘 次 数 。 部 分 查询 返回 无 解 ， 仅 统计 有 解 的 路 径 的 平均 换 
乘 次 数 , 如 表 6 所 示 。TAIL 索引 生成 的 路 径 的 平均 换 乘 次 数 都 
比 TTL 的 少 ,其 中 Denver 和 Berlin 两 组 数据 的 对 比 尤 为 明显 。 
原因 如 第 4.2 节 中 所 分 析 ，TAIL 在 生成 索引 的 时 候 按 旅程 扫 拱 
路 径 ， 保 持 了 旅程 的 完整 性 。 而 TTL 索引 基于 图 结构 ， 图 结构 
没 能 有 效 地 表达 出 旅程 完整 性 , 因此 TTL. 生成 的 路 径 换 乘 次 
数 偏 多 。 


nu 


表 6 各 数据 集 的 路 径 平均 换 乘 次 数 


数据 集 TAIL TTL 
Austin 5.37 8.27 
Budapest 9.52 20.94 
Houston 5.09 7.4 
Denver 6.86 27.57 
Saint Petersburg 8.56 13.93 
Rome 7.68 10.47 
Toronto 6.26 10.19 
Berlin 7.04 26.83 


6 ”相关 工作 


Chi 


近年 关于 公交 网 络 


种 图 模型 : 时 间 志 
一 个 顶点 表示 “到 达 (或 离开 ) 站 点 ” 
个 顶点 表示 一 个 
生成 的 图 的 规模 较 小 ， 而 且 
求解 更 高 效 。Daniel 等 人 提出 了 


H 
X 


用 多 线程 


事 人 


l nX ive (ERR J 
: 公交 网 络 路 径 规 划 问 题 中 的 一 种 高 效 索 引 


的 路 径 规 划 问 题 有 大 量 的 五 
这 些 工作 大 多 数 用 图 结构 表示 公交 网 络 。Pyrga 等 人 提出 了 两 
六 展 模型 和 时 间 依 赖 模型 个 。 时 间 扩 展 模型 用 


站 点 。 实 验 验证 ， 


方法 


ALIE, 


而 时 间 依 赖 模型 用 一 


这 两 种 模型 中 ， 时 间 依 赖 模 
用 Time-dependent Dijkstra 算法 
一 种 共享 优先 队列 的 方法 多 

行 计算 的 方式 求解 给 定 出 发 时 间 范 围 的 EAP Julian 


等 人 提出 的 CSA 算法 外 并 不 采用 Dijkstra 算法 。CSA 利用 了 表 


示 公 交 网 络 的 图 


是 有 向 无 环 图 的 特性 ， 将 (离开 站 点 A， 
点 B) 的 事件 按时 间 排 序 得 到 一 个 事件 数组 , 通过 一 次 扫描 事件 


到 达 站 


数组 求 得 EAP, 避免 了 Dijkstra 算法 的 昂贵 的 堆 操 作 。Wu 等 人 


提出 了 类 似 CSA 的 方法 09， 


并 提出 了 


种 用 多 线程 


行 计 算 


求解 的 方法 。 上 述 的 方法 都 是 没有 建立 索引 的 方法 ， 在 较 大 规 


模 的 公交 网 络 图 


中 查询 速度 较 慢 。 


男 一 类 算法 是 预先 对 图 做 预 处 理 ， 计 算 部 分 路 径 信 息 生成 
索引 ， 然 后 在 索引 上 做 查询 。 学 者 们 将 路 网 中 的 求解 最 短路 径 
的 索引 思想 引入 公交 网 络 中 ， 例 如 有 ALTEN, SHARCHA, 
CHTU?, Public Transit Labelling04 等 等 。 但 实验 表明 ， 这 些 方 


网 下 的 。 此 外 ， 学 者 还 提 


法 虽然 在 路 网 上 有 效 ， 在 公交 网 络 中 的 加 速效 果 却 比 不 上 在 路 
上 了 结合 了 CSAI 思 想 的 ACSA 算法 


05], Bast 等 人 提出 一 种 工 Patterns 方法 ， 该 方法 预先 计算 出 路 
径 的 换 乘 模式 (Transferpatterm0g,， 然 后 根据 换 乘 模式 查找 EAP, 


1H T.Patterns 并 不 能 保 订 


上 述 的 方法 


中 ， 换 乘 次 数 是 


没有 考虑 到 路 径 的 换 乘 次 数 ， 
符 等 人 提出 了 


达 度 的 方法 ， 能 得 到 最 小 换 乘 的 多 条 有 效 路 径 0 。 


个 重要 的 问题 。 


FE 精确 解 .TTLO 是 近期 提出 的 一 种 索引 ， 
文 [1] 中 的 实验 表明 TTL 比 CHT, CSA 等 方法 更 


效 。 


但 是 在 路 径 规 划 
种 基于 节点 可 


头等 人 考虑 


换 乘 因 素 和 步行 因素 的 影响 ， 在 Dijkstra HARE E. 5| A3 


ARAE TI RARR RIELS, Gerth EA di 
法 , 能 求 出 换 乘 次 数 为 n 的 最 上 
了 一 种 求解 换 乘 次 数 限制 的 近似 算法 PY。 


RAPTOR 只 可 以 
23 n 的 最 早 到 达 


上 了 一 种 多 层 Dijkstra 算 
到 达 路 径 09]。Geroge 等 人 提出 


Delling 等 人 提出 的 


在 用 多 线程 并 行 计算 ， 能 快速 地 找到 换 乘 次 数 


路 径 。1 


这 些 算 法 是 在 原 图 上 做 查询 的 ， 速 度 


远 比 不 上 带 索 引 的 算法 。 关 于 公交 网 络 中 路 径 规划 问题 更 详 旨 
的 讨论 可 参考 Bast 等 


7 ARA 


本 文 提出 了 


TAIL 索引 。TAIL 与 


写 的 综述 文章 只]。 


一 种 基于 旅程 扫描 和 2-Hub-Labelling 思想 的 


TTL 索引 有 相似 的 结构 ， 因 此 具有 相仿 的 


às 


索引 大 小 与 查询 时 间 。 与 TTL fHEG, TAIL 能 有 效 地 减少 生成 


路 径 的 换 乘 次 数 。 现 实 公 交 网 络 中 一 般 线 路 数 是 


了 限 的 ， 当 线 


路 下 包含 的 满足 < 关系 的 旅程 数 越 多 时 ，TAIL 建立 索引 的 时 间 


比 TTL 的 越 快 。 


尽管 TAIL 索引 能 减少 4 


成 路 径 的 换 乘 次 数 ， 


但 不 能 保证 所 得 路 径 必 定 是 换 乘 次 数 最 少 的 。 下 一 步 工 作 将 研 
完 受 换 乘 次 数 限制 的 最 快 路 径 的 高 效 索引 。 
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